library(plotly)
## Warning: package 'plotly' was built under R version 4.1.3
## Carregando pacotes exigidos: ggplot2
## Warning: package 'ggplot2' was built under R version 4.1.3
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## v purrr 0.3.4
## Warning: package 'readr' was built under R version 4.1.3
## Warning: package 'forcats' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks plotly::filter(), stats::filter()
## x dplyr::lag() masks stats::lag()
library(readxl)
## Warning: package 'readxl' was built under R version 4.1.3
library(stringr)
library(ggthemes)
## Warning: package 'ggthemes' was built under R version 4.1.3
require(gridExtra)
## Carregando pacotes exigidos: gridExtra
## Warning: package 'gridExtra' was built under R version 4.1.3
##
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
##
## combine
Neste trabalho será realizado um estudo sobre as ocorrências de crimes registradas no Estado de São Paula com base nos dados estatísticos coletados pela Secretaria de Segurança Pública do Estado de São Paulo no período de 2002 a 2021.
A análise criminal é um instrumento otimizador das ações do Estado para combater a violência em seu território. Sendo assim, realizar uma análise sobre as ocorrências criminais registradas no Estado de São Paulo é de extrema importância visto que, ao longo dos anos, a violência no Estado é cada vez maior.
Em 2021, o estado de São Paulo possuía uma taxa de mortes violentas de 6,6 vítimas para cada 100 mil habitantes, levando em consideração o fato de que mais de 44 milhões de pessoas vivem no estado de São Paulo, são mais de 3 mil mortes violentas por ano. Além disso, em 2022 praticamente todos os indicadores de violência no Estado de São Paulo pioraram no mês de março e a tendência é que continuem aumentando.
Com isso, salienta-se a necessidade e importância da realização de análise criminal no Estado de São Paulo com o intuito de promover políticas públicas e ações policiais cada vez mais eficientes que melhorem as condições de segurança pública.
Referencias:
Foi utilizada a base de dados que contém o registro das ocorrências de diferentes tipos de crimes nas cidades do Estado de São Paulo, mas para fazer uma análise relativa, utilizamos outra base de dados que contêm a população total de cada cidade. Com o uso do comando left_join juntamos as duas bases de dados de acordo com o id dos municípios.
#Importando as bases de dados
dados <- read.csv("ocorrencias_registradas.csv",
fileEncoding = "utf-8") %>%
filter(ano<2021)
pop <- read_excel("total_populacao_sao_paulo.xlsx")
View(dados)
View(pop)
#Definindo a coluna id_municipio como numeric
pop <- pop %>%
mutate(id_municipio=as.integer(id_municipio))
## Warning in mask$eval_all_mutate(quo): NAs introduzidos por coerção
#Selecionando apenas as colunas de interesse da base pop
pop <- pop %>%
select(id_municipio,nome_municipio,pop_2010)
#Agregando as duas bases
dados <- dados %>%
left_join(pop,by="id_municipio")
#Selecionando as colunas de interesse da base final
dados <- dados %>%
select(-c(regiao_ssp,
numero_de_vitimas_em_homicidio_doloso,
numero_de_vitimas_em_homicidio_doloso_por_acidente_de_transito,
numero_de_vitimas_em_latrocinio)) %>%
mutate(ocorrencias_tot = select(.,homicidio_doloso:furto_de_veiculo) %>%
rowSums(na.rm = TRUE))
#view(dados)
O gráfico acima representa a quantidade total de ocorrência no estado de São Paulo ao longo dos anos, nele os dados estão em milhares. A partir dele podemos concluir que a trajetória da evolução das ocorrências totais é conturbada ao longo dos anos.
Com diversas quedas ao longo dos anos, destaca-se a queda que ocorreu em 2020. A drástica redução no número de ocorrências registradas em 2020, de 1.412.942 ocorrências registradas em 2019 para 1.128.402 em 2020, ou seja, ocorreu uma queda de mais de 20% na quantidade de ocorrências registradas. Isso aconteceu por causa da pandemia do coronavírus que devido às restrições de isolamento impostas pelo Governo, diversos tipos de crimes como, furtos, roubos, furtos e roubos de carro sofreram queda significativa ao comparar seus valores de 2019.
Apesar de que durante esse período crimes cometidos contra as mulheres, como violência doméstica e feminicídios aumentaram consideravelmente, segundo a Unicef, a pandemia dificultou a denúncia de violência sexual no Estado de São Paulo, o que contribuiu ainda mais para a redução nas ocorrências nesses anos.
Em relação aos anos em que houve um aumento da criminalidade em SP, destaca-se o pico no ano de 2017, no qual foram registradas 1.554.233 ocorrências. Nesse ano, segundo o Atlas da Violência ocorreu o maior nível histórico de letalidade violenta intencional no Brasil, e isso se refletiu na quantidade de ocorrência registradas no Estado de são Paulo. Ref:
https://www.ssp.sp.gov.br/estatistica/pesquisa.aspx
##############################################################################
#Evoluçao dos crimes totais no Estado de Sao Paulo
grafico1 <- dados %>%
group_by(ano) %>%
summarise(ocorrencias_tot_ano = sum(ocorrencias_tot)/1000000) %>%
ggplot()+
geom_line(aes(ano,ocorrencias_tot_ano),color = "darkred", size = 1) +
labs(x = "Ano",
y = "Ocorrencias totais (em milhares)",
title = "Evoluçao das Ocorrencias") +
scale_y_continuous(n.breaks = 10) +
scale_x_continuous(n.breaks = 12) +
theme_bw() +
theme(axis.text.x = element_text(size = 10),
axis.text.y = element_text(size = 12),
panel.grid = element_blank(),
plot.background = element_rect(fill = "transparent", color = NA),
panel.background = element_rect(fill = "transparent", color = NA),
legend.background = element_rect(fill = "transparent", color = NA))
ggplotly(grafico1,tooltip="ocorrencias_tot_ano")
A fim de realizar uma análise de nível comparativo entre a evolução das ocorrências totais e um algum tipo de crime, foi utilizado a quantidade de roubos de veículos. A quantidade de roubo de veículos foi utilizada pois devido a presença do seguro, esse é o tipo de crime em que as pessoas têm muito incentivo para registrar a ocorrência, ou seja, é uma medida fidedigna para analisar o comportamento dos crimes cometidos no estado de São Paulo de 2002 a 2020.
Ao analisar comparativamente os dois gráficos, as ocorrências de roubos de veículos parecem acompanhar a tendência das ocorrências totais ao longo dos anos. Ambos os gráficos apresentam quedas significantes nos anos de 2008 e 2020, mas o ano que o roubo de carro se destaca é em 2014 e não em 2017.
Como comentado anteriormente o cenário de pandemia diminuiu alguns tipos de crime entre eles a quantidade de veículos roubados, esse fato é comprovado no gráfico, pois do mesmo jeito que a quantidade de ocorrências totais caíram 20% de 2019 para 2020, o número de roubos de veículos que já vinha diminuindo desde seu pico em 2014, sofreu uma redução de mais de 30%, de 2019 para 2020.
#Vendo a relação entre roubos de veiculos e ocorrencias totais
grafico2 <- dados %>%
group_by(ano) %>%
summarise(roubos_veic_tot = sum(roubo_de_veiculo)/1000) %>%
ggplot()+
geom_line(aes(ano,roubos_veic_tot),color = "darkblue", size = 1) +
labs(x = "Ano",
y = "Roubos de veículos (em milhares)",
title = "Evoluçao dos roubos de veiculo") +
scale_y_continuous(n.breaks = 10) +
scale_x_continuous(n.breaks = 12) +
theme_bw() +
theme(axis.text.x = element_text(size = 10),
axis.text.y = element_text(size = 12),
panel.grid = element_blank(),
plot.background = element_rect(fill = "transparent", color = NA),
panel.background = element_rect(fill = "transparent", color = NA),
legend.background = element_rect(fill = "transparent", color = NA))
#Comparando
grid.arrange(grafico1,grafico2,ncol=2,nrow=1)
Para analisar a evolução das ocorrências totais por cidade utilizamos a população de cada um desses municípios para fazer uma análise relativa da quantidade de ocorrências per capita.
Nesse gráfico destaca-se o município Ilha Comprida, indicada pela trajetória da linha verde, que durante todos os anos da análise apresentou o maior número de ocorrências por pessoa. Sendo assim, analisando as ocorrências totais controladas pelo tamanho da população de cada município, a cidade de Ilha Comprida é o destaque negativo, devido ao seu alto número de ocorrências per capita desde 2002 até 2021, chegando a bater mais de 120 ocorrências por mil habitantes em 2017.
Vale ressaltar que Praia Grande apresentou considerável aumento no registro de ocorrências per capita a partir de 2010, chegando a atingir mais de 84 ocorrências para cada mil habitantes em 2019.
Ademais, de grosso modo, grande parte dos municípios estão no intervalo de 10 a 40 ocorrências registradas a cada mil habitantes por ano, sem nenhum município que se destaque positivamente, isto é, com poucas ocorrências per capita.
#Vendo as cidades mais perigosas em termos per capita do Estado de SP com bases
# em ocorrencias totais
cid_mais_perig <- dados %>%
group_by(ano,nome_municipio) %>%
summarise(ocorrencias_tot_pop = sum(ocorrencias_tot)/pop_2010*1000) %>%
ggplot()+
geom_line(aes(ano,ocorrencias_tot_pop,
group = nome_municipio, color = nome_municipio)) +
labs(x = "Ano",
y = "Ocorrencias totais por mil habitantes",
title = "Evolução das Ocorrencias por mil habitantes") +
scale_y_continuous(n.breaks = 10) +
scale_x_continuous(n.breaks = 15) +
theme_bw() +
theme(axis.text.x = element_text(size = 10),
axis.text.y = element_text(size = 12),
panel.grid = element_blank(),
plot.background = element_rect(fill = "transparent", color = NA),
panel.background = element_rect(fill = "transparent", color = NA),
legend.background = element_rect(fill = "transparent", color = NA))
## `summarise()` has grouped output by 'ano', 'nome_municipio'. You can override
## using the `.groups` argument.
ggplotly(cid_mais_perig,tooltip = c("nome_municipio","ocorrencias_tot_pop"))